让大模型学会「自己教自己」!京东&中科院信工所连发三篇论文定义Self-Taught RLVR 让大模型学会「自己教自己」!京东&中科院信工所连发三篇论文定义Self-Taught RLVR 关键词: AI新闻,模型训练,Self-Taught,Self-Taught RLVR 最近,京东和中科院信工所展开了Self-Taught RLVR的系列研究,并连发三篇后训练新作。 来自主题: AI技术研报 6577 点击 2026-05-19 14:59